iT邦幫忙

2019 iT 邦幫忙鐵人賽

DAY 14
0

Moore 對多GPU 進行訓練感到興趣,所以他打算買兩張顯示卡來玩玩,藉由 海外知名C2C網站,買到相當便宜的 GPU 1060 ,他花不到新台幣六千元就拍到兩張 GTX 1060 ,而且還是 6GB 版,對 Cash,Fields 有在玩電競的,均覺得便宜到不可思議。要知道即使現在顯示卡價格已經跌落了,但GTX 1060 6GB 都還在八千元一張。

Cash 告知如果要兩張卡能發揮最大功效,一定要找 CPU 支援兩張顯示卡都能在 PCIE 3.0 16 Lanes,他幫忙查一下,最便宜的似乎就是 AMD Threadripper 1900X,有 40 PCIE Lances。而且必須買 X399 主機板,光是這兩項加起來至少就要兩萬元。如果再補上最基礎的 RAM與SSD 就超出 Moore 預算許多。

Moore:”Cash 能幫個忙嗎?再找一下更精簡便宜一點的。那顆 CPU 設計功率要 180瓦,這可不是 Mooooore is Better。”

這個PCIE 話題引起大家的興趣,Pete 說他知道許多自行組電腦再加上幾張顯示卡就可以當作挖礦機,看他們的電腦配備也是很普通的PC,為何不能給 Moore 便宜一點的方案

Fields 搶回:”這個我與 Cash 討論過啦!挖礦軟體需要從CPU傳到 GPU量很少,後續計算幾都在GPU裡面完成。但是我們做深度學習的訓練時,在進行所謂的梯度下降過程,經常大量的資料從CPU搬移到 GPU,所以需要高速的 PCIE 頻寬來支持。雖然有人嘗試測試似乎在gooLenet,VGG,LSTM 等差異不太明顯。
但其前一篇比較 又談到如果把CPU到 GPU PCIE通道從 16 Lanes 降為 8 Lanes,有網路(nbody 雙GPU)的訓練速度會大幅降低。而且還要考慮如果SSD 採用 PCIE 以求讀取速度,要額外佔掉 4 Lanes。一般 CPU 只有提供 16 Lanes。 我研判資料大到每次從 CPU 吞吐到 GPU 的數值量是數百MB以上的,多少還是會速度,這點上述的測試看來沒有特別指出。”

大家對CPU,主機板的方案選擇大約有共識,可以買更豪華的 Server 級(例如:Intel® Xeon® 處理器 E5-2620 搭 X99 主機板),或者較高端的電競配備,除了 AMD Threadripper 19x0X,29x0X,還有 Intel i9-79xoX 可以選。Cash 更提醒大家,要在主機安裝多顯示卡務必計算最大使用功率,還有機殼散熱方案與空間,這也是一筆不小的開銷。

Moore 為了滿足大家的期待,主機相關配備早早就買好安裝好,放在辦公室裡,等一拿到顯示卡就來安裝 雙GPU與對應驅動程式與CUDA,要用自購的 雙1060 來與 公司的單1080 Ti尬速度。

終於拿到了貨了,趕緊拿給 Cash,Cash 光是看到外觀馬上雷倒在地,怎麼還有 VGA 輸出接口?印象中 Nvidia 新版的顯示卡已經取消掉老舊的VGA接口,網路再多查一下,似乎有人把 GTS 450 改了 BIOS 冒充是 1060。


市面上突然開始有許多 Nvidia RTX 20x0系列的顯示卡販售,大家躍躍欲試,但是價格讓人卻步2080 Ti 幾乎四萬台幣上下。Cash 再次強調:GPU 影響對大多數的深度學習計算速度影響極大,這個投資應該合算。對個人或是小團隊而言,無預算限制的話 2080 Ti 是很足夠的,但是他並不推薦諸如 Tesla V100 (針對非Server 級的一般機器有PCIE 版本提供)給個人或是工作室,寧可把同樣的錢去購置 雙甚或三 GPU,這樣就可以練習多GPU運算。

另外Molly 也觀察到 RTX 2080 的價格可以買 GTX 1080 Ti,她之前測試機器翻譯時,經常會用到超過10GB的VRAM,而看了一些評測兩者速度並沒顯著差異,她以自己的需求來看,會買 1080 Ti (11 GB RAM)。

Moore 也提起對岸同事有人買一部帶有 Geforce 1070 有 8 GB VRAM 的筆電,居然花不到 RMB 九千元,而且還是台灣藍天代工的品質不錯,他覺得很心動又想再次海掏,以彌補那兩週山寨顯示卡的損失,希望大家給他鼓勵加強信心。

備註:

專案緣起記錄在 【UP, Scrum 與 AI專案】


上一篇
Docker 使用速成
下一篇
Docker 進一步使用
系列文
深度學習所需入門知識--一位初學者的認知31
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言